iT邦幫忙

2024 iThome 鐵人賽

DAY 7
0
生成式 AI

從系統設計切入,探索 GenAI 在企業中的實踐系列 第 7

[Day7] HuggingFace 下載 LLM & License 開源授權商用須知

  • 分享至 

  • xImage
  •  

HuggingFace 是一個更正式的模型下載平台,並提供多種模型選擇,也讓開發者可以尋找其他人 fine-tune 過的模型。


Model Hub

https://ithelp.ithome.com.tw/upload/images/20240907/20151660Mx23mC8RLT.jpg
首先,進入 Model Hub 的頁面,可以看到下方分別有 models, spaces, datasets 三種類別。

  1. models: 可以下載開源模型如 LLama 3.1 8BMistral 7B ,也有許多其他開發者 fine-tune 好的模型可供選擇。
  2. spaces: 展示其他開發者使用模型架設的 Demo App,可以即時體驗不同模型的效果。
  3. datasets: 提供用來訓練模型的資料集,這部分會在進行 fine-tune 時深入探討。

Model Card

https://ithelp.ithome.com.tw/upload/images/20240908/20151660UvxtofCUlO.jpg
meta-llama/Meta-Llama-3.1-8B-Instruct 為例,進入頁面後,在模型名稱下方可以看到該模型的重點摘要。開發過程中,通常會參考模型的主要功能在模型使用上,依據 license 的不同會有不同的使用限制。以下列出幾種常見的開源授權條款: (Text Generation)、支援語言、以及商用開模模型的 License 規範 (Llama 3.1 Community License Agreement)。

除了 HuggingFace 之外,Llama 3.1 也有在 GitHub 上提供更詳細的模型資訊模型評比結果各評比項目的說明、以及最重要的 License 商業授權說明

License 使用許可

如同開源項目的提供,在模型使用上也會依照 license 有不同的限制,以下整理常見的使用許可:

License 特點 使用限制 嚴謹程度
MIT License 簡單且寬鬆,允許自由使用、修改、分發,適用於開源和商業用途。 需保留原版權聲明和許可條款,無其他限制。
GNU GPL (v2/v3) 強制開源,任何修改或衍生品都必須在相同條款下發佈,保護開源精神。 修改或衍生品需遵守相同GPL條款,整合軟體也需開源。
Apache License 2.0 允許自由使用、修改、分發,並提供專利授權保護,適合商業應用。 需保留版權聲明,修改需註明,適合商業應用但要注意專利保護。
BSD License 提供較高的靈活性,允許自由使用、修改和發布,商業項目也適用。 需保留版權聲明,禁止使用原作者名稱作宣傳。
MPL 2.0 允許部分文件在開源條款下修改,並允許開源與內部代碼共存。 修改的部分需公開,但可與內部代碼一起使用。
The Unlicense 完全放棄版權,作品置於公有領域,允許任何人自由使用、修改和發布。 無限制,完全自由使用,無需提及原作者。

HuggingFace Repo

HuggingFace 還是一個供開發者存放模型和資料的平台,Llama 3.1 的模型資料就可以在這個 Repo中查看,包含使用資訊、config、model 和 tokenizer。

看完了模型資訊後,就可以進入正式下載流程。

Llama 3.1 8B 模型下載操作

透過 Llama CLI

這裡依照官方的下載流程

  1. 首先到官網上註冊並索取授權
  2. 開啟 terminal,輸入 pip install llama-toolchain 下載操作套件
  3. 執行 llama model list 查看所有模型資訊
    https://ithelp.ithome.com.tw/upload/images/20240907/201516606XClS8jLcO.jpg
    • 可以看到模型的檔案都是存在 HuggingFace 的 repo 當中
  4. 執行 llama download --source meta --model-id Meta-Llama3.1-8B-Instruct 下載模型
  5. 輸入取得的授權 URL,即可成功下載

透過 huggingface-hub

  1. 同樣到 HuggingFace 上註冊並索取授權
  2. 待得到授權後,先索取待會會使用到的 Access token
    https://ithelp.ithome.com.tw/upload/images/20240908/20151660TF9XVZKXcC.jpg
    • 點擊右上角個人大頭照
    • 點選 setting
    • 左側點擊 Access tokens
    • 點擊 Create new token
    • 可以從 Repositories permissions 中選取剛剛申請授權的 repo
    • 如果不想一直重新申請的話,也在 User permissions 設定允許所有讀寫
  3. 開啟 terminal,輸入 git lfs install 確認已經安裝 git
  4. 執行 git clone https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct 下載模型
  5. 此時會跳出 git credentials 認證,輸入自己的帳號和 token 就可以了

ref.


上一篇
[Day6] LM Studio-一鍵架好你的地端 Chatbot
下一篇
[Day8] Langchain 的 GenAI 開發生態系-Runnable 組件介紹
系列文
從系統設計切入,探索 GenAI 在企業中的實踐30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言